Cactus: Acelerando la decodificación autoregresiva con muestreo especulativo de aceptación restringida Optimiza la decodificación autoregresiva con muestreo especulativo y acelera tus procesos de manera eficiente 2026-04-08 · 2 min